随着姿势估计和图形卷积网络的进步,基于骨架的两人互动识别一直在越来越多的关注。尽管准确性逐渐提高,但计算复杂性的提高使其在现实环境中更不切实际。由于常规方法不能完全代表体内关节之间的关系,因此仍然存在准确性改善的空间。在本文中,我们提出了一个轻巧的模型,以准确识别两人的交互。除了结合了中间融合的体系结构外,我们还引入了一种分解卷积技术,以减少模型的重量参数。我们还引入了一个网络流,该网络说明体内关节之间的相对距离变化以提高准确性。使用两个大规模数据集NTU RGB+D 60和120的实验表明,与常规方法相比,我们的方法同时达到了最高准确性和相对较低的计算复杂性。
translated by 谷歌翻译
Esports, a sports competition using video games, has become one of the most important sporting events in recent years. Although the amount of esports data is increasing than ever, only a small fraction of those data accompanies text commentaries for the audience to retrieve and understand the plays. Therefore, in this study, we introduce a task of generating game commentaries from structured data records to address the problem. We first build a large-scale esports data-to-text dataset using structured data and commentaries from a popular esports game, League of Legends. On this dataset, we devise several data preprocessing methods including linearization and data splitting to augment its quality. We then introduce several baseline encoder-decoder models and propose a hierarchical model to generate game commentaries. Considering the characteristics of esports commentaries, we design evaluation metrics including three aspects of the output: correctness, fluency, and strategic depth. Experimental results on our large-scale esports dataset confirmed the advantage of the hierarchical model, and the results revealed several challenges of this novel task.
translated by 谷歌翻译
电子商务网站属性价值提取(AVE)的主要挑战是如何处理多种产品的大量属性。尽管该挑战是通过一个问题回答(QA)方法来解决的,该方法在给定查询(属性)的产品数据中找到值,但对于稀有和模棱两可的查询,它不能有效地工作。因此,我们根据基于质量质量质量检查的AVE的查询(属性)的可能答案(属性)提出了简单的知识驱动查询扩展。我们从培训数据中检索查询(属性)的值以扩展查询。我们用两个技巧来训练一个模型,即知识辍学和知识令牌混合,这模仿了测试中价值知识的不完善。我们清洁版的Aliexpress数据集的实验结果表明,我们的方法改善了AVE的性能(+6.08宏F1),尤其是对于稀有和模棱两可的属性(分别为+7.82和+6.86宏F1)。
translated by 谷歌翻译
本文迈出了一个全局线性时间逻辑规范的反应性,分层多机器人任务分配和计划框架的第一步。四倍体机器人和轮式机器人的功能都可以通过一个异质团队来完成各种导航和交付任务。但是,当部署在现实世界中时,所有机器人都可能容易受到不同类型的干扰,包括但不限于运动失败,人类干预和环境的障碍。为了解决这些干扰,我们建议任务级的本地和全局重新分配策略,以有效地在线生成更新的动作状态序列,同时保证完成原始任务的完成。这些任务重新分配方法消除了重建整个计划或重新合成新任务的方法。为了将任务计划者与低级输入集成,行为树执行层监视不同类型的干扰,并采用重新分配方法来制定相应的恢复策略。为了评估该计划框架,在现实的医院环境中进行了动态模拟,其异质机器人团队由四足动物和轮式机器人组成,用于交付任务。
translated by 谷歌翻译
建立一种人类综合人工认知系统,即人工综合情报(AGI),是人工智能(AI)领域的圣杯。此外,实现人工系统实现认知发展的计算模型将是脑和认知科学的优秀参考。本文介绍了一种通过集成元素认知模块来开发认知架构的方法,以实现整个模块的训练。这种方法是基于两个想法:(1)脑激发AI,学习人类脑建筑以构建人类级智能,(2)概率的生成模型(PGM)基础的认知系统,为发展机器人开发认知系统通过整合PGM。发展框架称为全大脑PGM(WB-PGM),其根本地不同于现有的认知架构,因为它可以通过基于感官电机信息的系统不断学习。在这项研究中,我们描述了WB-PGM的基本原理,基于PGM的元素认知模块的当前状态,与人类大脑的关系,对认知模块的整合的方法,以及未来的挑战。我们的研究结果可以作为大脑研究的参考。随着PGMS描述变量之间的明确信息关系,本说明书提供了从计算科学到脑科学的可解释指导。通过提供此类信息,神经科学的研究人员可以向AI和机器人提供的研究人员提供反馈,以及目前模型缺乏对大脑的影响。此外,它可以促进神经认知科学的研究人员以及AI和机器人的合作。
translated by 谷歌翻译
虽然已经提出了许多背景感知神经机器转换模型在翻译中包含语境,但大多数模型在句子级别对齐的并行文档上培训结束到底。因为只有少数域(和语言对)具有此类文档级并行数据,所以我们无法在大多数域中执行准确的上下文感知转换。因此,我们通过将文档级语言模型结合到解码器中,提出了一种简单的方法将句子级转换模型转换为上下文感知模型。我们的上下文感知解码器仅在句子级并行语料库和单语演模板上构建;因此,不需要文档级并行数据。在理论上,这项工作的核心部分是使用上下文和当前句子之间的点亮互信息的语境信息的新颖表示。我们以三种语言对,英语到法语,英语到俄语,以及日语到英语,通过评估,通过评估以及对上下文意识翻译的对比测试。
translated by 谷歌翻译